[求助]电视节目单网站的数据来源及处理流程

来源:百度知道 编辑:UC知道 时间:2024/06/02 09:15:02
在网上看了www.tvsou.comwww.tvmao.comwww.aaahatv.com等N个节目预报网站,对他们的网站架构有几点不明白:
一、他们全国各地的各个电视台数据都很全面,那么数据来源是怎样的呢?
(1)通过各个电视台的官方网站来做BOT抓取?
①这样并无法抓取到各个节目的“类别”(如是电视还是电影还是综艺节目,更不会有对应的链接<如问题二>)
②BOT抓取运行时间长,这么多节目单无法实行更新
(2)和电视台合作,由每个电视台按照标准(每个网站不同)提供具体数据?
①这种合作仿佛不会给电视台带来实质收益,合作条件如何拟定?
二、他们几乎每个节目都有对应的链接,如CCTV1 20:00-21:25 播放的是电视剧:走西口;那么就会有个链接指向电视剧走西口的分页面(甚至有的网站还指定了分集介绍),那么这个链接赋值的流程是怎样的呢?
(1)通过一条条语句去匹配,如
UPDATE jiemudan SET dianshiid=1 WHERE name like '走西口';
但这样的话可能会出现问题:
①如果有一个电视剧名为“走西口走东口”,它不是“走西口”,如果执行上面一条语句,就有可能错误定向走西口为dianshiid=1。
这样并无法做到精确匹配
②如果电影,电视剧库的数据量非常大的话,这样SQL赋值语句的数量会非常庞大,要逐条去匹配耗费服务器资源且效率低下
(2)通过节目播放的时段来匹配节目类别,如先指定了CCTV1 20:00-21:25这一时段为电视剧,再由专人手动查询并声明dianshiju指向的ID。
这样工作量应该也不

通过一条条语句去匹配,如
UPDATE jiemudan SET dianshiid=1 WHERE name like '走西口';
可以通过限定字数精确搜索
只更新变动,减小流量
电视台可以在做每个节目时顺带做好节目单,统一上传主机

纯属个人猜测

我可以为你解答,消息聊

偶看

;l][